acoustic model 指“声学模型”,常见于自动语音识别(ASR)等领域:用统计或神经网络方法把输入的语音信号特征(如频谱特征)与语言单位(如音素、音节或字/词的发音状态)之间建立映射,用来估计“某段声音对应某个发音单位”的概率或匹配程度。(在更广义的声学/声学工程语境中,也可指对声音传播与反射等现象的建模,但最常见用法在语音识别。)
/əˈkuːstɪk ˈmɑːdəl/
The acoustic model converts audio features into probabilities for speech sounds.
声学模型把音频特征转换为语音声音单位的概率。
To improve recognition in noisy streets, we retrained the acoustic model with more diverse recordings and careful alignment.
为了提升在嘈杂街道环境中的识别效果,我们用更多样的录音并配合精细对齐来重新训练声学模型。
acoustic 来自希腊语 akoustikos(“与听觉有关的”),源于 akouein(“听”)。model 来自拉丁语 modulus(“尺度、标准”),经法语进入英语,表示“模型、范式”。合起来 acoustic model 字面义为“用于描述/计算声音(听觉相关现象)的模型”,在语音技术中专指“语音声学到发音单位的映射模型”。